iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 6
0
AI & Data

索引結構與機器學習的相遇系列 第 6

Day 6 - 建置Model學習CDF分布

  • 分享至 

  • xImage
  •  

前一天我們簡略地介紹了CDF,Kraska et al. 發現對於排序好的Key值,其CDF的分布會近似於Key值的位置~

下面這張圖為Key 與 CDF 的曲線圖,取自The Case forLearned Index Structures.

https://ithelp.ithome.com.tw/upload/images/20200921/20129198mjwhsYJeCo.png

X軸為Key值,Y軸為Pos,這裡的Pos為經由CDF函式產生的近似位置,對於這樣的分布,Kraska et al. 提出使用Model學習CDF的分布,這也是整篇Paper的主軸,使用Model來訓練、學習資料的CDF分布,預測出資料的位置,那該講的都講完拉~~就這樣吧XD

開玩笑低..XD

Model的建置則是使用機器學習或是深度學習,可以是簡單的線性回歸(Linear Regression),也可以是多神經網路。

那可能會有人好奇,欸~所謂的學習CDF分布是怎麼學習? 通常建置模型不是要抓特徵,那特徵是什麼? 那標籤呢?

在這裡跟大家一一說明,特徵是Key值,標籤是CDF。

對...就是這樣XD,我們將所有Key值對應其CDF預測出的Pos拿去訓練,來建置模型。

最後只要輸入Key值經由Model就能吐出預測的Pos喔,真的牛逼阿 !

老話一句,一張圖勝過千言萬語 ~

https://ithelp.ithome.com.tw/upload/images/20200921/20129198Ce45SKeKnF.png

Reference

Kraska, Tim, et al. "The case for learned index structures." Proceedings of the 2018 International Conference on Management of Data. 2018.


上一篇
Day 5 - CDF是甚麼 ?
下一篇
Day 7 - 不精準問題
系列文
索引結構與機器學習的相遇30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言